導讀:Mozilla希望讓初創公司,研究人員和業余愛好者更容易構建支持語音的應用,服務和設備。為此,它今天發布了最新版本的Common Voice,這是一個開源的語音數據集,現在包括來自42000名貢
發表日期:2019-09-02
文章編輯:興田科技
瀏覽次數:10302
標簽:
Mozilla希望讓初創公司,研究人員和業余愛好者更容易構建支持語音的應用,服務和設備。為此,它今天發布了最新版本的Common Voice,這是一個開源的語音數據集,現在包括來自42000名貢獻者超過1400小時的語音樣本,涵蓋18種語言,包括包括英語、法語、德語、荷蘭語、Hakha Chin語、世界語、波斯語、巴斯克語、西班牙語、中文、威爾士語和卡布語。
Mozilla聲稱,它是同類語言中最大的多語言數據集之一,比8個月前公開的普通語音語料庫要大得多,其中包含了2萬名英語志愿者500小時,40萬份錄音,而且語料庫很快就會擴大。該組織表示,70種語言的數據收集工作正在通過通用語音 網站 和移動應用程序積極開展。
通用語音可以集成到Deepspeech中,這是一套由Mozilla的機器學習小組維護的開源的語音到文本、文本到語音引擎和經過培訓的模型,它不僅包含語音片段,還包含一些自愿者提供的元數據,這些元數據可用于培訓語音引擎,如演講者的年齡、性別等等。
為了簡化流程,Mozilla本周推出了一款改進的Common Voice網絡工具,可以根據不同的提示進行剪輯,還提供了用于查看、重新錄制和跳過剪輯的新控件。此外,它還推出了新的配置文件功能,允許用戶跨語言跟蹤進度和指標,并添加人口統計信息。Mozilla表示,在接下來的幾個月里,它將嘗試不同的方法來通過社區努力和新的合作伙伴關系,增加數據的數量和質量。最終目標旨在為那些尋求構建和使用語音技術的人提供更多更好的語音數據。

【來源:cnBeta.COM】
更多新聞
2023
搜索引擎優化(SEO)是提高網站在搜索引擎結果中排名的技術。通過優化網站結構、關鍵詞、元標簽等方面的因素,可以提高網站的可見性和流量。關鍵是找到與云南網絡推廣相關的關鍵詞,并將其合理地融入網站內容中。
View details
2023
內容是網站優化的核心。您應該確保您的網站內容是獨特、有用和高質量的。同時,您還應該在內容中使用關鍵詞,并避免過度堆砌關鍵詞,以免被搜索引擎認定為垃圾信息。此外,使用標題和段落來組織您的內容,使其易于閱讀和理解。
View details
2022
英國女王伊麗莎白二世8日在蘇格蘭巴爾莫勒爾堡去世,終年96歲。她的長子、王儲查爾斯繼承王位。 白金...
View details
2023
樂陵網站開發是一個幫助樂陵企業和個人構建專業、高效網站的過程。通過選擇樂陵網站開發,客戶可以得到專業團隊的支持,高效交付的保證,以及與客戶需求密切結合的個性化服務。無論是企業宣傳還是個人展示,樂陵網站開發都可以幫助客戶在激烈的市場競爭中脫穎而出。如果您有網站開發的需求,請選擇樂陵網站開發,我們將為您打造一個設計精美、功能強大的網站。樂陵網站開發,讓您的網站與眾不同!
View details